Co je duplicitní obsah
Duplicitní obsah znamená, že se stejné informace (textové, obrazové a další) vyskytují ve stejné podobě na různých stránkách (URL adresách). Je potřeba si na to dávat pozor především s ohledem na optimalizaci pro vyhledávače.
Vyhledávače nechtějí předkládat uživatelům stejný obsah vícekrát, proto si vyberou pouze jednu stránku, kterou zaindexují a zobrazují. Pokud na vyřazenou adresu (adresy) směřují zpětné odkazy, obvykle je vyhledávací robot taktéž začne ignorovat.
Jak duplicitní obsah vzniká
Duplicity mohou vznikat kopírováním cizích textů či používáním obsahu, který se vyskytuje na více webech, protože představuje univerzální řešení například pro konkrétní produkt (typicky jde o popisky zboží publikované dodavateli či výrobci).
Často se duplicitní obsah vytváří odkazováním na totožné stránky z různých míst pomocí čtyř různých URL adres. Příklad:
- http://nazevwebu.cz
- http://nazevwebu.cz/uvod.htm
- http://www.nazevwebu.cz
- http://www.nazevwebu.cz/uvod.htm
Dochází k tomu především u velkých webů se spoustou podstránek, kdy se některé dříve zveřejněné příspěvky přesunují do archivu apod.
Dále lze za duplicity považovat citované pasáže nebo textové části, které se zobrazují na více místech jednoho webu. Typicky se nacházejí i u produktů umístěných do více kategorií apod.
Možnosti odhalení a předcházení vzniku
Možností, jak stejný obsah na internetu objevit, existuje několik. Snadný způsob poskytují specializované nástroje, které duplicity vyhledají a označí, aby je tvůrce či správce webu mohl odstranit nebo vhodně upravit.
Zároveň se nabízejí i metody a postupy, které zabrání jejich vzniku. Dále uvádíme vybraná doporučení:
- Při odkazování na stránku je vhodné používat jednu variantu URL adresy (například jen s www).
- URL adresa by neměla obsahovat tzv. session id.
- Je vhodné nastavit přesměrování s kódem 301 v souboru .htaccess. Tím je možné dát vyhledávačům najevo, který obsah mají preferovat.